1.1 OBJETIVO DE LOS SISTEMAS DE BASE DE DATOS 

• DBMS: DATA BASE MANAGEMENT SYSTEM (SISTEMA DE MANEJO DE BASE 
DE DATOS). 

. DBM: DATA BASE MANAGER (MANEJADOR DE BASE DE DATOS). 

• DB: DATA BASE (BASE DE DATOS). 

Un DBMS consiste de una base de datos y un conjunto de aplicaciones (programas) para 
tener acceso a ellos. Comunmente, la base de datos contiene informacion interrelacionaday 
referente a una misma entidad o empresa. 

El objetivo primordial de un DBMS es crear un ambiente en el que sea posible almacenar y 
recuperar informacion en forma eficiente y conveniente. 

Otro modelo que se utiliza comunmente para manipular una base de datos es el llamado 
SISTEMA DE PROCESAM IENT O DE ARCHIVOS; que consta de un conjunto de 
programas que permiten el acceso a la base de datos, pero no optimizan los metodos 
utilizados, provocando entre otros los siguientes problemas: 

• REDUNDANCIA. Esta se presenta cuando se repiten innecesariamente datos en los 
archivos que conforman la base de datos. Esta redundancia aumenta los costes de 
almacenamiento y acceso y ademas puede llevar a inconsistencia de los datos. 

• INCONSISTENCIA. Ocurre cuando existe informacion contradictoria o incongruente en 
la base de datos. 

• DIFICULTAD EN EL ACCESO A LOS DATOS. Debido a que los sistemas de 
procesamiento de archivos generalmente se conforman en distintos tiempos o epocas 
y ocasionalmente por distintos programadores, el formato de la informacion no es 
uniforme y se requiere de establecer metodos de enlace y conversion para combinar 
datos contenidos en distintos archivos. 

• AISLAMIENTO DE LOS DATOS. Se refiere a la dificultad de extender las aplicaciones 
que permitan controlar a la base de datos, como pueden ser, nuevos reportes, utilehas 
y demas debido a la diferencia de formatos en los archivos almacenados. 

. ANOM ALIAS EN EL ACCESO CONCURRENTE. Ocurre cuando el sistema es 
multiusuario y no se establecen los controles adecuados para sincronizar los procesos 
que afectan a la base de datos. Comunmente se refiere a la poca o nula efectividad de 
los procedimientos de bloqueo. 

• PROBLEMAS DE SEGURIDAD. Se presentan cuando no es posible establecer claves 
de acceso y resguardo en forma uniforme para todo el sistema, facilitando asf el 
acceso a intrusos. 

• PROBLEMAS DE INTEGRIDAD. Ocurre cuando no existe a traves de todo el sistema 
procedimientos uniformes de validacion para los datos. 

1.2 ABSTRACCION DE LA INFORMACION 

Uno de los objetivos del DBMS es el ocultar al usuario final ciertos aspectos tecnicos 
relativos al diseno de los manejadores, puesto que estos no son relevantes para este 
usuario final. 

Las estructuras de datos utilizadas para el almacenamiento y recuperacion de la informacion 
son muchas veces altamente complejas con el objeto de crear un sistema eficiente. 

Para diferenciar las etapas en que cada operador, disenador y otros personajes intervienen, 
debe distinguirse entre los siguientes niveles de diseno: 

1. NIVEL FISICO. Es aquel en el que se determinan las caracteristicas de 
almacenamiento en el medio secundario. Los disenadores de este nivel poseen un 



amplio dominio de cuestiones tecnicas y de manejo de hardware. Muchas veces se 
opta por mantener el nivel ffsico proporcionado por el sistema operativo para facilitar y 
agilizar el desarrollo. 

2. NIVEL CONCEPTUAL. Es aquel en el que se definen las estructuras logicas de 
almacenamiento y las relaciones que se daran entre ellas. Ejemplos comunes de este 
nivel son el diseno de los registros y las ligas que permitiran la conexion entre registros 
de un mismo archivo, de archivos distintos incluso, de ligas haciaarchivos. 

3. NIVEL DE EDICION. Es aquel en el que se presenta al usuario final y que puede 
combinaciones o relaciones entre los datos que conforman a la base de datos global. 
Puede definirse como la forma en el que el usuario aprecia la informacion y sus 
relaciones. 

1.3 MODELOS DE DATOS 

Un modelo de datos es un conjunto de herramientas conceptuales para describir los datos, 
las relaciones entre ellos, su semanticay sus limitantes. 

Los modelos de datos se clasifican en tres grupos principales: 

1. MODELOS LOGICOS BASADOS EN OBJETOS. Son aquellos que nos permiten una 
definicion clara y concisa de los esquemas conceptual y de vision. Su caracteristica 
principal es que permiten definir en forma detallada las limitantes de los datos. 
Ejemplos de este tipo de modelos son: 

§ Modelo entidad relacion. 

§ Modelo binario 

§ Modelo semantico de los datos 

§ Modelo infologico 

2. MODELOS LOGICOS BASADOS EN REGISTROS. Operan sobre niveles conceptual 
y de vision. Sus caracterfsticas principales son que permiten una descripcion mas 
amplia de la implantacion, pero no son capaces de especificar con claridad las 
limitantes de los datos. Son ejemplos de este tipo de modelos: 

§ Modelo relacional: Los datos y las relaciones se representan mediante 
tablas, cada una con diferentes columnas y nombres unicos. 

§ Modelo de red: Los datos se representan mediante nombres de registros 
y las relaciones mediante conjunto de ligas. 

§ Modelo jerarquico: Es semejante al modelo de red, pero con una 
estructura arbolada. 

3. MODELOS FISICOS DE DATOS. Describen los datos en el nivel mas bajo y permiten 
identificar algunos detalles de implantacion para el manejo del hardware de 
almacenamiento. Ejemplos de este tipo de modelos son: 

■ Modelo unificador 

■ Modelo memoriade cuadros 

1.4 INSTANCIAS Y ESQUEMAS 

Como es obvio, la base de datos es dinamica y por tanto se encuentra sujeta a 
modificaciones constantes por la agregacion, eliminacion y alteracion de datos. 

Para definir las distintas etapas por las que atraviesa una base de datos, se utiliza el 
concepto de instancia de la base de datos, esta se refiere al estado que esta guarda en 
un momento determinado. 

Tambien es relevante el observar que uno o varios archivos pudieron ser sujetos a una 
reestructuracion o reorganizacion. Para solucionar el problema referente al estado que 



guarda la estructura de la base de datos, se define el concepto de esquema de la base de 
datos; este hace referencia al estado que guarda la organization conceptual (estructura, 
ligas, relaciones y demas) de la base de datos en un momento determinado. 


REESTRUCTURACION. Cuando se hacen cambios en la estructura, quitar un campo, 
agregar, modificar longitud o un tipo. 

REORGANIZACION. Cambiar el modelo con el que se controla el acceso a los datos. 

NOTA: Comunmente la reorganizacion trae como consecuencia la reestructuracion. 

Existen varios esquemas para cada nivel de la base de datos; de tal forma, tenemos un 
esquema ffsico, esquema conceptual y esquema de vision (llamado tambien subesquema). 

1.5 INDEPENDENCE DE LOS DATOS 

Esta se refiere a la libertad que pueda existir para modificar algunos de los esquemas sin 
que exista la necesidad de reescribir los programas de aplicacion. 

Existen basicamente dos tipos de independencia: 

INDEPENDENCE FISICA. Esta se presenta cuando es posible la modificacion del 
esquema ffsico sin afectar a los esquemas restantes. Las principales razones para llevar a 
cabo una modificacion del esquema ffsico seran un ajuste en el hardware de 
almacenamiento o una redistribucion de los datos en el. 

INDEPENDENCE LOGICA. Ocurre cuando se modifica el esquema conceptual sin afectar 
al resto de los esquemas. Basicamente se modifica el esquema conceptual cuando cambian 
las caracterfsticas de los datos a almacenar. 

Es relativamente mas sencillo y probable lograr la independencia ffsica puesto que una 
modificacion del esquema conceptual, (estructuras, ligas y demas ) inevitablemente 
requerirade modificaciones el codigo parasu manipulacion 


1.6 LENGUAJE DE DEFINICION DE DATOS 

Un esquema de base de datos se especifica por medio de un conjunto de definiciones que 
se expresan mediante un lenguaje especial llamado lenguaje de definicion de datos. 

El resultado de la combinacion de sentencias de DDL es un conjunto de tablas las cuales se 
almacenan en un archivo especial llamado diccionario de datos. 

El DDL (Data Definition Language) es aquel que permite describir un esquema de base de 
datos. Las definiciones resultantes conformaran al DICCIONARIO DE DATOS. 

Un DICCIONARIO DE DATOS es un archivo que contiene metadatos que se consulta antes 
de leer o modificar datos reales en el sistema de base de datos. 


1.7 LENGUAJE DE MANIPULACION DE DATOS 

El DML (Data Manipulation Language) nos sirve para manejar la informacion contenida en la 
base de datos. Este manejo consiste basicamente en la insercion, recuperacion, eliminacion 
y modificacion de la informacion. 



El DML aplicado a nivel fisico sera utilizado para realizar procesos que permitan un acceso 
mas eficiente a la informacion; en el nivel de vision tendra como finalidad mostrar al usuario 
destino los datos en una forma clara y sencilla. 

Existen dos tipos de DML: 

DE PROCEDIMIENTOS. Especifican cuales datos habran de ser manipulados y el metodo 
que se utilizara para ello. 

SIN PROCEDIMIENTOS. Solamente especifican los datos a manejar. 

Los DML de procedimientos son mucho mas eficientes en lo que respecta a sus 
capacidades de manejo y control de la informacion, pero su complejidad es mayor. 

Se define una consults como una operacion que solicita la recuperacion de informacion. La 
parte del DML que se encarga de procesar esta recuperacion se conoce como LENGUAJE 
DE CONSULTA. 

1.8 MANEJADOR DE BASES DE DATOS 


Es una interface entre los datos de bajo nivel y los programas de aplicacion y modulos de 
consulta que se utilizan a nivel de usuario. 

Las funciones del manejador de bases de datos son: 

La interaccion con el manejador de archivos, esto se Neva acabo traduciendo proposiciones 
con el DML a instrucciones de bajo nivel para la manipulacion de los datos. 

Implantacion de integridad, se encarga de verificar que durante las actualizaciones no se 
viole ninguna limitante de consistencia. 

Mejoramiento del nivel de seguridad, se encarga de restringir el acceso mediante una serie 
de password u otros medios de identificacion y validacion. 

Respaldo y recuperacion, proporciona medios automaticos o semiautomaticos para el 
respaldo de la informacion. Permite tambien la recuperacion del sistema en caso de caidas, 
restablecimiento el estado original de la base de datos hasta antes de la falla. 

Control de concurrencia, supervisa los accesos en un ambiente multiusuario, determinando a 
que parte del codigo y de los datos pueden accesar los usuarios en un momento 
determinado. El objetivo primordial es mantener la consistencia de la base de datos. 

1.9 ADMINISTRADOR DE LA BASE DE DATOS 

El DBA es quien tiene el control centralizado de la base de datos. Se persigue con esto 
reducir el numero de personas que tengan acceso a los detalles tecnicos y de diseno para la 
operacion del DBMS. 

Las soluciones principales de un DBA son: 

DEFINICION DEL ESQUEMA. Crea el esquema original de la base de datos y genera el 
diccionario de datos por medio de proposiciones en DDL. 

DEFINICION DE ESTRUCTURAS DE ALM ACENAMIENTO Y METODOS DE ACCESO. 

Se encarga de generar o seleccionar estructuras para el medio secundario y definir los 
metodos de acceso a la informacion, esto ultimo por medio de proposiciones en DML. 



MODIFICACION DE ESQUEMA Y ORGANIZACION. Es una actividad poco frecuente que 
consiste en redisenar el esquema de la base de datos. Esto se harfa necesario ante la 
modificacion abrupta de las condiciones originales que dieron pie al diseno del esquema 
primario. Las proposiciones para llevar a cabo esta tarea se realizan en DDL. 

CONCESION DE AUTORIZACIONES DE ACCESO. Se encarga de registrar a los usuarios 
para permitir su acceso al DBMS. Asigna a cada uno de ellos una serie de atributos que le 
permiten gozar de privilegios como el acceso a determinadas areas de aplicacion, de los 
datos o del uso de recursos en el sistema. 

ESPECIFICACION DE LAS LIMIT ANTES DE INTEGRIDAD. Crea una serie de tablas 
donde se especifica el conjunto de restricciones que seran aplicables durante los procesos 
de actualizacion 


1.10 USUARIOS DE LA BASE DE DATOS 

El objetivo primordial de un sistema de base de datos es proporcionar un entorno para 
recuperar informacion y almacenar nueva informacion en la base de datos. 

Las personas tienen acceso DBMS se clasifican de la siguiente manera: 

USUARIOS INGENUOS. Son aquellos que interactuan con el sistema por medio de 
aplicaciones permanentes. 

USUARIOS SOFISTICADOS. Son aquellos con la capacidad de acceder a la informacion 
por medios de lenguajes de consulta. , 

PROGRAMADORES DE APLICACION. Son aquellos con un amplio dominio del DML 
capaces de generar nuevos modulos o utilerfas capaces de manejar nuevos datos en el 
sistema. 

USUARIOS ESPECIALIZADOS. Son aquellos que desarrollan modulos que no se refieren 
precisamente al manejo de los datos, si no a aplicaciones avanzadas como sistemas 
expertos, reconocimientos de imagenes, procesamiento de audio y demas. 

1.11 ESTRUCTURA GENERAL DEL SISTEMA 

Un sistema de base de datos se divide en modulos que tratan cada una de las 
responsabilidades del sistema general. En la mayona de los casos, el sistema operativo del 
computador proporciona unicamente los servicios mas basicos, y el sistema de la base de 
datos debe partir de esa base. Asf el diseno de un sistema de base de datos debe incluir la 
consideracion de interfaz entre el sistema de base de datos y el sistema operativo. 

El sistema global puede verse como la agrupacion e interaccion de los siguientes 
elementos: 

MANEJADOR DE ARCHIVOS. Asigna espacio en el medio de almacenamiento para las 
estructuras que habran de almacenar la informacion. 

MANEJADOR DE BASE DATOS. Es la interface entre los datos de bajo nivel y los 
programas de aplicaciones. 

PROCESADOR DE CONSULT AS. Se encarga de traducir las proposiciones de un lenguaje 
de consultas a instrucciones de bajo nivel. 

PRECOMPILADOR DE DML. Se encarga de traducir las proposiciones en DML al lenguaje 
de diseno del manejador (Pascal, C, Ensamblador etc. ). 

COMPILADOR DE DDL. Se encarga de convertir las proposiciones en DDL a tablas que 
contienen metadatos. 


Las estructuras de datos requeridas para la operacion del DBMS son: 



ARCHIVOS DE DATOS. Almacenan a la base de datos. 

DICCIONARIO DE DATOS. Almacenan informacion referente a la estructura de la base de 
datos. 

fNDICES. Permiten un acceso eficiente (rapido y confiable) a la informacion almacenada en 
la base de datos. 


Unidad II: 

Modelo Entidad_Relacion 

• 2.1 Entidad v Conjunto de Entidades. 

• 2,2 Relation v Coniunto de Relaciones. 

• 2.3 Limitantes de Mapeo. 

• 2.4 T, laves Primarias. 

• 2,5 Diagramas de Entidad Relation, 

• 2.6 Reduction de Diagramas E R a Tablas. 

• 2,7 Generalizarinn v Especializacidn. 

• 2.8 Agregacion. 

2. MODELO ENTIDAD-RELACION 


Es uno de los modelos togicos basados en objetos y por to tanto se enfoca primordialmente a tos niveles conceptual y de 
vistoa Una de las caracteristicas de este modelo es que permite representar con claridad las limitantes de tos datos. El modelo 
Entidad-Relacion es en esencia una herramienta para representar el mundo real por medio de simbotogias y expresiones 
determinadas. 


2.1 ENTIDADES Y CONJUNTOS DE ENTIDADES 

Una entidad es un objeto que existe y puede ser distinguido de otro objeto. Una entidad puede ser concreta (un libro, un 
automovil etc.) o abstracta (fecha, edad, etc.). 

Un conjunto de entidades es un grupo de entidades del mismo tipo. Una entidad puede pertenecer a mas de un conjunto de 
entidades a la vez. Por ejempto, la entidad persona puede ser parte de tos conjuntos de entidades atomnos, empleados, clientes 
etc. 

Una entidad se distingue de otra porque posee ciertas caracteristicas que la hacen unica. A estas caracteristicas se les conoce 
como atributo. Elrango de vatores validos para un atributo determinado sera conocido como dominio del atributo. 

Ejemplo: 

Entidad Empleado X 


Atributo : 


-RFC 
-N ombre 

-Salario (2000.. 10,000) 

-Edad (18.. 60) 

Una entidad se describe por un conjunto de parejas en el siguiente formato (atributo, valor del dato); debiendo especificarse 
una pareja por cada atributo de la entidad. 

Ejemplo: 

{(N ombre, Juan), (Edad,15), (Carrera,LI) } 

2.2 RELACIONES Y CONJUNTOS DE RELACIONES 

Una relacion es una asociacion entre varias entidades. Un conjunto de relaciones un grupo de relaciones del mismo tipo. 

La mayoria de las relaciones son BIN ARIAS; no obstante, pueden existir relaciones que incluyan a mas de dos conjuntos de 
entidades. 

Normalmente asocian a dos conjuntos de entidades y la relacion tendra una fimcion determinada; a esta se le denomina papeL 
Normalmente se utilizan los papeles para etiquetar y asi reconocer las relaciones establecidas. 



Las relaciones tambien pueden tener atributos descriptivos, en cuyo caso, la relacion se describe indicando la pareja (atributo, 
ultimo valor del atributo) sobre la relacion. 


2.3 LIMITANTES DE MAPEO 

El modelo E-R permite definir una serie de limitantes aplicables en la informacion contenida en la base de datos basicamente, 
pueden definirse dos tipos de limitantes: 

a) CARD IN ALIDAD DEL MAPEO.- es aquella mediante la cual puede especificarse la cantidad de entidades que podran 
asociarse mediante una relacion. 

La CARDINALIDAD delmapeo se aplica generalmente sobre dos conjuntos de entidades. 

Las cardinalidades existente para dos conjuntos de entidades A y B y conjunto de relaciones R pueden ser: 

1. UNA A UNA: Una entidad de A puede asociarse unicamente con una entidad de B. 

2. UNA A MUCHAS: Una entidad de a puede asociarse con cualquier cantidad de entidades de B. 

3. MUCHAS A UNA: Cualquier cantidad de entidades de A puede asociarse con una entidad de B. 

4. MUCHAS A MUCHAS: Cualquier cantidad de entidades de a puede asociarse con cualquier cantidad de entidades en 
B. 

Ejemplo: 


UNA A UNA 
Alumnos Tesis 


UNA A MUCHAS 
Carreras Alumnos 


MUCHAS A UNA 
Alumnos Carreras 


MUCHAS A MUCHAS 
Alumnos Materias 


B 


A 


B 


B 


B 


j) DEPENDENCIA DE EXISTENCIA.- Nos permiten definir que un conjunto de entidades esta condicionado a la existencia 
de otro un ejemplo de este condicionamiento se da entre una entidad alumno y la entidad calificacion. 

A esta limitante se le denomina dependence por existencia. Si una entidad Y requiere de una entidad X para existir se dice que 
Y es dependiente por existencia de X; est implica que si elirninamos a la entidad X; debera elirninarse la entidad Y. 

Para el caso anterior, se nombrara a X como la entidad dominante. y a Y como entidad subordinada 

2.4 LLAVES PRIMARIAS 


Uno de los procesos de mayor relevancia en la manipulation de una base de datos es el de distinguir entre las diversas 
entidades y relaciones que son manipuladas. Entendemos como una Dave al medio que nos permite identificar en forma univoca 
(unica e inequivoca) a una entidad dentro de un conjunto de entidades. 

Existen diversas categorias que permiten clasificar los tipos de Daves a utDizara: 

a) SUPER -LLAVE Es un conjunto de atributos mediante los cuales es posible reconocer a una entidad. Este tipo de Daves 
contiene comunmente atributos ajenos: es decir; atributos que no son indispensables para Devar a cabo el reconocimiento del 
registro. 

Ejemplo: 

Conjunto de entidades: 

Cursos 

Atributos Super Daves 

* Nombre materia Nombre, mat, carrera, semestre 

* Carrera Nombre, mat, carrera, unidades 

* Semestre Nombre, mat, carrera, semestre. periodo 
*Periodo Nombre, mat, carrera 

*Unidades 

-Si el conjunto de atributos X es una super Dave entonces cualquier conjunto de X sera super- Dave. 

b) LLAVE CANDID ATO.- Son aqueDas super Daves que no contienen atributos ajenos; es decir, aqueDos conjuntos de 
atributos que no tienen un subconjunto menor que pueda considerarse como super Dave. 

c) LLAVE PRIMARIA.- Es aqueDa Dave que el disenador de la base de datos selecciona entra las Daves candidatos 
encontradas. 

Existen conjuntos de entidades que no poseen los atributos necesarios para conformar una Dave primaria; se les conoce como 
entidad debD . Cuando existen los atributos necesarios para formar una Dave primaria, se denominan entidad fuerte . Las entidades 
debiles se subordinan a las entidades fuertes. 

Ejemplo: 


Fuerte Debil Fuerte 



Nota: ncred y clave son las Haves primarias. 

En el ejemplo anterior se pretende que el proceso de renta es una entidad abstracta para clarificar el concepto de entidad 
debil. No obstante, la mejor implementaron consiste en manipular a la renta como una relacion. 

Las entidades debiles no pueden ser conocidas por si solas; con el objeto de diferenciarlas se seleccionan algunos de sus 
atributos para formar un discriminador. Este discriminador se asocia con las Daves primarias de las entidades fuertes a las que se 
encuentre subordinada para formar asi su Dave primaria propia. 

Los conjuntos de relaciones tambien tienen Daves primarias. Estas se conforman por las Daves primarias de los conjuntos de 
entidades que se asocian en la relacion y todos los atributos descriptivos de la relacioa 


2.5 DIAGRAMAS DE ENTIDAD - RELACION 

Son esquemas que nos permitan representar conjunto de entidades y sus relaciones mediante la siguiente simbologia. 



* Conjunto de entidades o relacion con sus atributos 

* Conjunto entidades con relaciones 

* Cada elemento debe etiquetarse con su nombre. 



a) Las entidades debiles se senalan como rectangulos de doble pared 

b) Los papeles se indican etiquetando las Dneas que conectan a los rectangulos con los rombos. 

Ejercicios: 

Represente mediante Diagramas E-R las siguientes situaciones: 

— Un video club mantiene el control de sus cDentes utDizando los siguientes datos: numero de credencial, nombre, direction y 
telefono; el catalogo de peDculas contiene para cada cassette los datos clave, titulo, clasificacion y costo de renta. 

A fin de imprimir los pagares y mantener un control de rentas, se registran tambien las fechas de renta y la cantidad de dias que el 
cliente mantendra la peDcula. 



CON JUNTO DE RELACIONES CON DERI VAC I ON MULTIPLE 

Puede darse el caso de que una relacion sea binaria: es decir, que asocie a mas de dos conjunto de entidades. En estos casos 
la unica variation para representar el modelo consiste en que se establecera C ARDINALIDAD para cada pareja de conjuntos 
de entidades. 



— En un almacen se lleva el control de los articulos que son vendidos y facturados. El objetivo primordial ademas de mantener la 
information almacenada consisten en proceso de facturacion. Los datos que se registran: RFC del cliente, nombre del cliente, 
domicilio, clave del articulo, description, costo unitario, numero de factura, fecha, cantidad de articulos vendidos (de cada uno). 


2.6 REDUCCION DE DIAGRAMAS E-R A TABLAS. 

Con el objeto de observar instances de las bases de datos, los diagramas E-R se convierten en tablas, Se obtiene una tabla 
por cada conjunto de entidades o de relaciones. 

Existen reglas bien definidas para la conversion de los elementos de un diagrama E-R a tablas: 

a) ENTIDADES FUERTES.- Se crea una tabla con una columna para cada atributo del conjunto de entidades. 

b) ENTIDADES DEBILES.- Se crea una tabla que contiene una columna para los atributos que forman la Have primaria de la 
entidad fuerte a la que se encuentra subordinada. 

c) RELACION.- se crea una tabla que contiene una columna para cada atributo descriptivo de la relacion y para cada atributo 
que conforma la Have primaria de las entidades que estan relacionadas. 


Convierta a tablas y muestre instances donde pueda observarse la CARDIN ALIDAD del diagrama E-R en el caso del video 
club. 





2.7 GENERALIZACION Y ESPECIALIZACION 


Son procesos que tienen por objeto la fusion o descomposicion de atributos que confoiman entidades. La generalizacion 
persigue la niininiizaron de redundancia en la base de datos de tal manera que puedan ocultarse las diferencias entre entidades 
formando asi entidades comunes. 


La especializacion en el proceso inverso de la generalization; tiene por objeto reducir el espacio de almacenamiento requerido 
por la base de datos en el medio fisico. Trae como consecuencia una redundancia necesaria, pero suprime el gasto de espacio en 
el medio secundario para aquellas columnas que no almacenan information por entidades bien determinadas. 



INCONVENIENTES DEL MODELO 

Entre las limitaciones que presenta este modelo destacan dos: 

-No pueden presentarse relaciones entre conjunto de relaciones. 

-No pueden visualizarse instancias mediante los diagramas E-R. 

2.8 AGREGACION 


Es una tecnica que permite representar a un bloque de entidades relacionadas como si fueran un solo conjunto de entidades; 
permitiendo asi la relation entre conjunto de relaciones 

Unidad III: 

Modelo Relacional 


• 3.1 Estructura de las Bases de Datos Relacionales. 


• 3.2 Lenguajes Formales de Consulta. 

• 3.3 Lenguajes Comerciales de Consulta. 

• 3.4 Modificaciones de las Bases de Datos. 

• 3.5 Vistas. 

MODELO RELACIONAL 

Este modelo opera en los niveles conceptual y de vision, y tiene la caracteristica de que los resultados de un diseno 
mues trail caracteristicas bien definidas que seran utilis para la implementacion del nivel conceptual. 

3.1 ESTRUCTURA GENERAL DE LA BD RELACIONALES 



3.2 LENGUAJES FORMALES DE CONSULTA 

Existe un sistema de DML conocido como algebra relacional que permite especificar operaciones de consulta a traves de 
pasos intermedios de generacion de tablas utilizando formatos especiales. En el algebra relacional no son validos los operadores 
logicos. 

Existen dos clasificaciones de procesos en algebra relacional; en cada uno de ellos se toma una o dos tablas como entrada y se 
obtiene una tabla de salida. 

Estas clasificaciones son: 

Operaciones tradicionales 

o Union(union) 
o Interseccion(intersect) 
o Diferencia(minus) 
o Producto cartesiano (times) 

Operadores especiales 

o Select 
o Project 
o Join 
o Divide 

Operadores tradicionales : Estas requieren que las tablas a operar tengan la misma cantidad de atributos y que sus dominios 
coirespondientes sean semejantes o congruentes. 

a. UNION.- Constituye una tabla que contiene a todas las tuplas que aparecen en una o ambas tablas 
<tabla 1 >union<tabla2 > 

b. INTERSECCION.- Produce un atabla que contiene a aquellas tuplas que aparecen en ambas tablas 
<tablal >intersec<tabla2 > 

c. DIFERENCIA.- Produce un atabla que contiene todas las tuplas de la primera tabla operando que no aparecen en la 


segunda <tab]al>minus<tabla2> 

d. PRODUCTO CARTESIANO.- Produce un atabla que contiene todas las posibles concatenaciones entre los elementos 
de las tablas involucradas <tablal>times<tabla2> 

Operaciones especiales : 

a. SELECT.- Es un formato qu epermite extraer tuplas que satisfacen una condicion <tabla>where<condicion> 

b. PROJECT.- Es un formato que nos permite filtrar atributos en la tabla resultante, especificando aquellos que se desea 
obtener. <tabla>[<lista de atributos>] 

c. JOIN.- Construye una tabla a partir de dos tablas especificas, obteniendo todas las posibles combinaciones entre los 
elementos de estas y mostrando aquellas que satisfogan una condicion determinada 

<tabla 1 >j oin<tabla2 >where<condicion> 


Nota: Esta operation es semejante a una consulta sobre tabla global cuando se involucran dos tablas y una condicion de 
filtro. 

d. DIVIDE.-Toma dos tablas una de grado (M+N) y la otra de grado(N). construye una tabla de grado M que contiene 
todos los valores m de la relacion (M+N) cuyo complemento es igual a todos los valores de la relacion de orden N. 
<tabla 1 >DIVIDE<tabla2 > 

Ejercicios: 

a. Mostrar una lista que contenga los nombres y costos de las peliculas en existencia: 

videos[nombre,costo] 

b. Se desea conocer el nombre y domicilio de todos los clientes infantiles 

(clientes where estado = 'infentil')[nombre, domicilio] 

c. Se desea conocer el nombre de las peliculas que no son para ninos 

(videos where clasificacion -i = 'a')[titulo] 

d. Se desea la lista de los titulos que cuestan mas de 10.00 de peliculas para adultos 

((videos where costo>10.00)where clasif='c')[titulo] 

3.3 LENGUAJES COMERCIALES DE CONSULTA. 


En forma comercila existen diversos paquetes y/o lenguajes mediante los cuales se puede construir un modelo relacional El 
lenguaje que se considera estandar para este tipo de aplicaciones es el SQL(structured query languaje), este lenguaje de consulta 
estructurado proporciona formatos y sintaxis para la manipulation y definition de los datos. 


FORMATOS SQL 
DDL 


Crear Tablas 

CREATE TABLE<nombre de la tabla> 

( 

<campol> (<tipo>[,NO NULL]), 

<campo2> (<tipo>[,NO NULL]),... 

) 

Tipos Validos 

■ CHAR (<LONG>)[VAR] 

■ FLOAT 

■ INTEGER 

■ SMALLINT 

Crear Indices 

CREATE [UNIQUE] INDEX <nom.indice> ON < nom>tab!a> 

( 

<nomcampol> [ASC/DES], 

<nomcampo2> [ASC/DES],... 

) 

Modificar Tablas (expandirlas) 

■ EXPAND TABLE <nom.tabla> 

■ ADD FIELD <nom.campo> (<TIPO>[NO NULL]) 

Eliminar Tablas 

■ DROP TABLE <nomtabla> 

Borrar Indices 

■ DROP <nom>indice> 


Tablas 

CREATE TABLE persona 

( 

nombre(CHAR(40) VAR, NO NULL), 
edad(SMALLINT, NONULL), 
estatura(FLOAT, NO NULL), 


telefono(CHAR(7)) 

) 


Indices 
Por no mb re 

CREATE INDEX ind_nom ON persona 

( 

nombre 

) 

Por estatura sin llaves repetidas, descendente 

CREATE UNIQUE INDEX ind_est ON persona 

( 

estatura desc 

) 

Por edad(primero mas jovenes); edades repetidas, poe estatura(primero la mas alta) 

CREATE INDEX ind_ed_est ON persona 

( 

edad, estatura desc 

) 

Modificaciones 

■ EXPAND TABLE persona 

■ ADD FIELD direccion(CHAR(30), VAR, NO NULL) 


DML 

Insertar datos 

INSERT INTO <nom.tabla> 
[(<campol>,<campo2>...):] 

< <valorl>,<valor2>.„> 

Modificar datos 

UPDATE <nomtabla> 

SET <campol> = <campol>, 

<campo2> = <campo2>,... 

[WHERE <condicion>] 

Eliminar datos 

DELETE<nomtabIa> 

[WHERE <condicion>] 

CONSULTAS 
En una tabla 

SELECT [UNIQUE] <Iista de campos/*> 
FROM <nom>tabla> 

[WHERE <condicion>] 

[ORDER BY <campo> [asc/des]] 
Funciones integradas en select/where 
COUNT(*) conteo 
SUM(<campo>) total(acumulador) 
AVG(<campo>) promedio 
MAX(<campo>) maximo 
MIN(<campo>) minimo 

Ejemplo: 

Insert into persona 

< 'juan',15,l,75,'2-15-15','foijadores'> 

• Incrementar edad de todas las tuplas 

Update persona 
Set edad=edad+l 


• Personas menores a 20 anos ciecieron 10 centimetros 

Update persona 

Set estatura = estatura+0.10 

Where edad<20 



Select <nombre_tabla> 

where<campo char>LIKE <cadena de coincide ncia> 
caracteres validos en <cadena de coincide ncia> 

un caracter cualquiera. 

"%" una secuencia de caracteres cualquiera. 



( 

nc(integer,NO NULL), 
nombre(char(20)VAR,NO NULL) 
domicio(char(40)VAR,NO NULL) 
estado(char(15)VAR,NO NULL) 


) 

insert into clientes 
<320,'juan','fbrjadores','infantiT> 

<145,'pedro , , , cato]ica', , adulto , > 
create tabla videos 
( 

clave(char(4),NO NULL), 
titulo(char(2 0) VAR, NO NULL), 
clasificacion(char(l)VAR,NO NULL), 
costo(float,NO NULL) 

) 

insert into videos 
<'A320','Ia roca','b',12.00> 

<’b415', 'tornado', 'b',12.00> 

Create table renta 

( 

nc(integer,NO NULL), 
clave(char(4),NO NULL), 
fecha(char(8),NO NULL), 
dias(smaDint,NO NULL) 

) 

Insert into renta 
<320, 'A716', 7/10/97', 3> 

<320','b716','7/10/97'.3> 

Ejemplos: 

1. Muestre el nombre y estado de los clientes cuyo numero de credencial es mayor a 100 


select nombre estado 
form clientes 
where nc>100 

2. Se desea conocer la cantidad de clientes de cada estado 


select estado, count(*) 
from clientes 
grop by estado 

3. Se desea consultar los nombres de las peliculas que cuestan menos de 15.00 que no son infantiles. 

Select titulo 
From videos 

Where (costo < 15.00 and clasificacion u = "a") 

Consultas en varias tablas 

• En tabla global 

select [unique] <lista campos /*> 
from <lista de tablas> 
where <condicion> 

Este tipo de consultas se realiza sobre un atabla global que resulta de todas las combinaciones posibles entre las tuplas 


de las tablas involucradas. 

La condicion en el formato debe aprovecharse para colocar un filtro que permila que solo tas tuplas o combinaciones 
de estas que sean requeridas, se muestren; esto se logra por medio de las columnas con valor semejante o de las 
relaciones establecidas. 

Si un campo se encuentra en mas de una tabla, su referenda puede formarse con el formato tabla campo. 

Ejemplo: 

Se desea conocer la lista de los distintos titulos rentados el 8 oct 97 
Select unique video.tiulo 
From renta, videos 

Where (renta.fecha = '8/oct/97' and renta.clave = video.clave) 

Los discriminadores any/all son opcionales y se pueden combinar con un operador relacional o con in/not in en este 
tipo de consultas se procesa primeramente la tabla mas intema(tabla2) de la cual obtiene una salida determinada; los 
datos que se obtienen en esta salida se relacionan mediante el descriminador con los datos de la tabla externa, 
produciendo asi la salida final 
Ejemplo: 

• Se desea mostrar los titulos de las peliculas que han sido rentadas por lo mas de dos dias 
Select videos.titulo 
From videos, renta 

Where (videos.clave=renta.clave) and (renta.dias>2) 

En subconsultas 

select videos.titulo 
form videos 

where clave in ( select clave 
from rentas 
where renta.dias >2) 

El formato puede extenderse creando subconsultas enmultinivel Se asume elmismo criterio de resolver a partir de la 
tabla mas interna e ir relacionando los resultados con la tabla externa inmediata sucesivamente. 

Ejemplo: 

■ se desea conocer el domicilio de los clientes que han rentado peliculas para adolescentes. 

Select clientes. domicilio 
Form clientes 
Where nc in (select nc 
From renta 

Where clave in (select clave 
From videos 

Where clasificacion- b' )) 


• Enuniones 

Una union permite consultar los resultados de dos o mas tablas en una sola salida; cuando los resultados de las tablas son 
semejantes (muestran la misma informacion) se suprimen las salidas redundantes, operando asi como una union de conjuntos. 


Select <lista de campos/*> 
From <tablal> 
Where<condicinl> 
Ejemplo: 


Select <lista campos2/*> 
Union From<tabla2> 

Where<condicion2> 


• se desea obtener una lista de clientes y de peliculas se desea incorporar solo alos clientes infantiles y a las peliculas que 
pueden ser rentadas por estos. 


Select nombre 
From clientes 
Where estado-infantil' 


Select titulo 
U nion F rom videos 

Where clasificacion = 'a' 



3.4 MODIFICACION DE LA BASE DE DATOS. 


La modificacion de la base de datos se expresa usando el operador asignacion. Las asignacioes se hacen a relaciones ya 
existentes en la base de datos. 

1. Elimination. Una solicitud de eliminacion se expresa de forma muy parecida a una consulta. Sin embargo, en vez de 
presentar tuplas al usuario, quitamos las tuplas seleccionadas de la base de datos. Solo podemos eliminar tuplas completas; 
no podemos eliminar unicamente valores de determinados atributos. 

2. Insercion. Para insertar datos en una relation, bien especificamos la tupla que sa va a insertar o escribimos una consulta 
cuyo resultado sea un conjunto de tuplas que se va a insertar. 

3. Actualization. En ciertas ocasiones podemos querer cambiar un valor en una tupla sin cambiar todos los valores de la 
tupla. Sihacemos estos cambios usando eliminacion e insercion, es posible que no podamos conservar los valores que no 
queremos cambiar. En lugar de ello, usamos el operador actualization 

3.5 VISTAS 

Son una especie de tablas virtuales; es decir no existen fisicamente sino que forman mediante la selection y/o filtrado de los 
componentes de otras tablas, una vista puede ser definida en base a una lista previa. Esto significa que pueden crearse 
dependencia entre las vistas. 

Formato de definicion de vistas 


DEFINE VIEW<nombre vista> 

[(identif_campo 1, identif_campo2,. . .)] 

AS<operacion de consulta> 

■ Ejemplo: se desea crear una vista para obtener los nombres y domicilios de los clientes aduhos es deseable el 
establecimiento de las cabeceras nombre del cliente, domicilio del cliente. 

DEFINE VIEW cliente_adulto 
(nombre del cliente, domicilio del cliente) 

As(select nombre,domicilio 

From clientes 

Where estado = 'adulto') 

Como puede verse, la especificacion de los identificadores es optional; si estos se omiten se asumiran los nombres de los 
campos extraidos en la consulta. 

La operation de consulta permite todos los formatos validos de consulta en SQL con execepcion del groop by. 

Cuando una vista es definida en base a otra, se se dice que es dependiente de esta por lo tanto, se suprimira automaticamente 
la vista dependiente si se suprime la vista original 

Eliminacion de vistas 

Drop view <nombre tabla> 

• Ejemplo: suponga que se desea crear una vista dependiente de la vista cliente adulto que contenga solamente a los clientes 
que viven sobre forjadores. Se desean los mismos campos y la vista sera llamada cliente_adulto_forjadores. 

Define view cliente_adulto_forjadores 
AS (select * 

From cliente_adulto 

Where domicilio_del_cliente like 'forjadores%') 


drop view diente_adulto 

(se eliminara tambien la vista cliente_adulto_forjadores, puesto que es dependiente de cliente_adulto.) 

La eliminacion de una tabla provoca tambien la eliminacion automatica de todas las listas que se hayan definido haciendo 
referencia a ella. 


Unidad IV: 

Diseno de Bases de Datos Relacionales 


• 4.1 Riesgos en el diseno de las bases de datos relacionales. 

• 4.2 Normalization por medio de dependencias funcionales. 

• 4.3 Normalization por medio de dependencias de producto 

• 4.4 Forma normal de dominio Have. 


4 BASES DE DATOS RELACIONALES 


No obstante que pueden desarrollarse sistemas de procesamiento de archivo e induso manejadores de bases de datos 
basandose en la experience del equipo de desarrollo de software logrando resultados akamente aceptables, siempre es 
recomendable la recomendacion de determinados estandares de diseno que garantizan el nivel de eficiencia mas alto en lo que 
refiere a almacenamiento y recuperation de la informacion. De igual manera se obtiene modelos que optimizan el 
aprovechamiento secundario y la sencillez y flexfbilidad en las consultas que pueden proporcionarse al usuario. 

OBJETIVOS DEL DISENO DE BASES DE DATOS 

Entre las metas mas importantes que se persiguen al disenar un modelo de bases de datos, se encuentran las siguientes que 



4.1 PELIGROS EN EL DISENO DE BASES DE DATOS RELACIONALES. 

Los principales inconvenientes que se presentan cuando el diseno de un modelo no satisface las formas 
normales son: 

* Repetition de la informacion 

* Dificultad para representar y/o interpretar cierta informacion. 

* Perdida de la informacion 

Ejemplo: Suponga que se desea controlar el prestamo de libros a alumnos del tecnologico. Se asume que 
existe una base de datos de la bibliografia existente cuya Have es la clasificacion. 


Version 1 


PROBLEM AS 

o Repeticion de datos del alurnno en cada prestamo 

o No es posible establecer comparativos con usuarios y no usuarios por solo estan restringidos los 
usuarios. 

o A1 modificar un atributo del alumno debera recorrerse todo el archivo... 


Version 2 (ESPECIALIZACION) 



o No funciona porque no hay relacion. 


Version 3 



o No es posible deteiminar fechas de prestamos de un libro a aun alumno en particular, 
o Solo se registran alumnos con prestamos o se desperdicia atributo clasif 

o Repetir datos del alumno por el prestamo o reutilizar el campo clasif, lo ultimo tiene dos problemas: 

■ Se pierde historial de prestamos 

■ Un alumno solo puede tener un prestamo a la vez. 

A1 caso mostrado en la Version 3 se le denomina DESCOMPOSICION CON PERDIDA dado que alrealizar la 
especializacion se pierde informacion que existia por la relacion entre los atributos. 

Version 4 



4.2 DEPENDENCES FUNCIONALES 

Las dependencias funcionales son una restriccion al conjunto de relaciones legales. Nos permiten expresar hechos acerca de la 
empresa que estamos modelando con la base de datos. 

Superclave se puede definir como sigue, sea R un esquema de relaciones. Un subconjunto K de R es una superclave de R si, 
en cualquier relacion legal r(R), para todos los pares C y t 2 de tuplas de r tales que t^ &S U p 1 ; t 2 , ti[K]&S U p 1 ; t 2 [K] . Es decir, 
dos tuplas en cualquier relacion legal r(R) no pueden tener el mismo valor en el conjunto de atributos K. 

La nocion de dependencia funcional generaliza la deflnicion de superclave. Sea &micro;l R y bl R. La dependencia funcional 


&micro;®b se cumple enR sien cualquier relation legal r(R), para todos los pares de tuplas yt 2 enr tales que tj&rriicro; 
]=t 2 [&micro; ], tambien se cumple que t^[b ]=t 2 [b ]. 

Utilizando la notacionde la dependencia funcional, decimos que K es una superclave de RsiK®R. Es decir, K es una 
superclase si siempre que t][K]=t 2 [K]. , tambien se cumpla que t][R]=t 2 [R] (es decir, t 4 = t 2 y 

Las dependencias funcionales nos permite expresar restricciones que no pueden expresarse por medio de superclaves. 
Considerese el esquema siguiente: 

Esquema - prestamo = nombre - sucursal, numero - prestamo, nombre - cliente, cantidad. 

Ejemplo: si un prestamo se hace a mas de un cliente en este caso a marido/mujer, entonces no esperariamos que el atributo 
numero - prestamo fuera una superclave. 

APLICA CIONE S 

Las dependencias funcionales se usan de dos formas: 

1. - Para especificar restricciones en el conjunto deceleraciones legales. O sea solo se interesa por las relaciones que satis fagan 
un conjunto dado de dependencias funcionales. Si queremos limitamos a las relaciones de esquema R que satis facen F, decimos 
que F se cumple en R. 

2. - Para probar si una relacion es legal bajo un conjunto dado de dependencias funcionales. Si una relacion r es legal bajo un 
conjunto F de dependencias funcionales, decimos que r satisface a F. 

Considerese la relacion r de la siguiente figura y veamos que dependencias funcionales se satis facen. Observese que A® C se 
satisface. Hay dos tuplas que tienen el valor de aj en A. Estas tuplas tienen el mismo valor en C, Cl &acute; . De manera similar, las 

dos tuplas con valor a 2 en A tienen el mismo valor en C, c 2 &acute; . No existen otros pares de tuplas distintos que tengan el mismo 
valor en A. Sin embargo, no se satisface la dependencia funcional C ® A. Para ver esto considerense las tuplas t 2 = ( a 2 ,b 3 ,c 2 , 

d 3 ) y t 2 = ( a 3 ,b 3 ,c 2 , d 4 ). Estas dos tuplas tienen el mismo valor en C, C 2 &acute; y distintos valores en A, a 2 y a 3 &acute; 
respectivamente. Asi hemos encontrado un par de tuplas t^ y t 2 tales que t 1 [C]=t 2 [C] pero tjJAj&supl; t 2 [A] 



CIERRE DE UN CONJUNTO DE DEPENDENCIAS FUNCIONALES 


No es suficiente considerar un conjunto dado de dependencias funcionales. Ademas necesilamos considerar todas las 
dependencias funcionales que se cumplen. Veremos que, dado un conjunto F de dependencias funcionales, podemos probar que 
se cumplen otras ciertas dependencias funcionales. Se dice que F implica logicamente dichas dependencias funcionales. 

Supongase que nos dan un esquema de relaciones R = (A, B, C, G, H, I) y el conjunto de dependencias funcionales 


A®B 


A®C 

CG®H 

CG®I 

B®H 

La dependencia funcional 
A®H 

Se implica logicamente. Es decir, podemos demostrar que siempre que se cumpla el conjunto dado de dependences, A®H 
tambien debe cumplirse. 

TECNICAS PARA DEDUCIR DEPENDENCIAS FUNCIONALES 

La primera tecnica se basa en tres axiomas o reglas de inferencia para dependencias funcionales. Aplicando 

estas reglas repetidamente, podemos encontrar F + completo dado F. En las reglas siguientes, adoptamos el 
convenio de usar letras griegas (&micro; ,b ,g ...) para conjuntos adoptamos el convenio de usar letras romanas 
mayusculas desde el principio del alfabeto para atributos individuales. Usamos &micro;b para representar 
&micro;Eb . 

REGLAS DE REFLEXIVIDAD. Si &micro: es un conjunto de atributos y bl&micro; entonces se cumple 
&micro;®b . 

REGLA DE AUMENTO. Sise cumple &micro:®b v g es un conjunto de atributos, entonces se cumple 
g&micro;®gb . 

REGLA DE TRANSITIVIDAD. Sise cumple &micro:®b , yse cumple b®g , entonces se cumple &micro;®g . 
Estas reglas son seguras porque no generan dependencias funcionales incorrectas. Las reglas son completas 

porque para un conjunto dado F de dependencias funcionales, nos permiten generar F + completo. Esta 
coleccion de reglas se llama axiomas de A. 

Para simplificar mas esta tarea, se listan a continuacion algunas reglas adicionales. Es posible utilizar los 
axiomas de Armstrong para probar que estas reglas son correctas. 

REGLA DE UNION .Si se cumplen &micro:® b v&micro:®g entonces se cumple &micro;®bg . 

REGLA DE DESCOMPOSICION. Sise cumple &micro:®ba .entonces se cumplen &micro;®b y&micro;®g . 
REGLA DE PSEUDOTRANSITIVIDAD. Sise cumplen &micro:®b vab®d .entonces se cumple &micro;g®d . 

FORMA NORMAL 

Se dice que una forma normal particular si satisface cierto conjunto especifico de restricciones; por ejemplo, 
se dice que una relacion esta en primera forma normal si y solo si satisface la restriction de contener 
unicamente valores atomicos . 

A continuacion se mencionan las formas normales que existen. 

FORMA NORMAL BOYCE-CODD 

Una de las formas normales mas deseables que podemos obtener es la forma normal Boyce-codd (BCNF). 

Un esquema de relaciones R esta BCNF con respecto a un conjunto F de dependencias funcionales si para 

todas las dependencias funcionales en F + de la forma &micro;® b , donde &micro;l R y bl R, por lo menos se 
cumple de las siguientes condiciones: 

&micro;®b es una dependencia funcional trivial (es decir, bl&micro; ). 

&micro; es una superclave del esquema R. 

Un diseno de base de datos esta en BCNF si cada una de los miembros del conjunto de los esquemas de 
relacion que comprende el diseno esta en BCNF. 

PRIMERA FORMA NORMAL 

Una relacion R esta en primera forma normal (INF) y si y solo si todos los dominios subyacentes solo 
contienen valores atomicos. 

Un dominio es atomico si los elementos del dominio se consideran unidades invisibles. 

Esta definition trata de decirnos que cualquier relacion normalizada esta en INF. Una relacion que tan solo 
esta en primera forma normal es decir, una relacion en INF que, ademas no esta 2NF y, por tanto, tampoco no 
esta en 3NF se dice que tiene una estructura indeseable. 

SEGUNDA FORMA NORMAL 

Una relacion R esta en segunda forma normal (2NF) si y solo si esta en INF y cada atributo no es primo 
completamente dependiente de la primera Have primaria. 


Un atributo es no primo si no participa en la Have primaria. 

TERCERA FORMA NORMAL 

En aquellos casos en los que no pueden satisfacerse los tres criterios de diseno, abandonamos BCNF y 
aceptamos una forma normal mas debil llamada TERCERA FORMA NORMAL (3NF). Veremos que siempre es 
posible encontrar una descomposicion de producto sin perdida que conserve las dependencias que esten en 
3NF. 

BCNF requiere que todas las dependencias no triviales sean de la forma &micro;®b , donde &micro; es una 
superclave. 

3NF hace un poco menos estricta esta restriction permitiendo las dependencias funcionales no triviales cuyo 
lado izquierdo no sea una superclave. 

Un esquema de relaciones R esta en 3NF con respecto a un conjunto F de dependencias funcionales si para 

todas las dependencias funcionales en F + de la forma &micro;®b , donde &micro;l R bl R, por lo menos se 
cumple una de las condiciones siguientes. 

&micro;b es una dependencia funcional trivial. 

&micro; es una superclave R 

Cada atributo A en b&frac34;&micro; esta contenido en una clave candidata de R. 

La definicion 3NF permite ciertas dependencias funcionales que nos permiten en BCNF. Una dependencia 
&micro;® b que satisface solo la tercera condition de la definicion de 3NF no se permite en BCNF, aunque si 
se permite en 3NF. 

CUARTA FORMA NORMAL 

Un esquema de relaciones R esta en 4NF con respecto a un conjunto D de dependencias funcionales si para 

todas las dependencias multivaluadas de D + de la forma &micro;® ®b , donde &micro;l Ry blR, se cumple 
por lo menos una de las siguientes condiciones: 

*&micro;® ®b es una dependencia multivaluada trivial. 

*&micro; es una superclave del esquema R. 

Un diseno de bases de datos esta en 4NF si cada miembro del conjunto de esquema de relaciones que 
comprende el diseno esta en 4NF. 

La analog fa entre 4NF y BCNF se aplica al algoritmo para descomponer un esquema en 4NF. La siguiente 
figura muestra un algoritmo de descomposicion en 4NF. 
resultado := {R}; 
listo:=falso; 

calcular F + ; 
while (not listo ) do 

if (existe un esquema Rj en resultado que no esta en 4NF ) 
then begin 

sea &micro;® ® b una dependencia multivaluada no trivial que se cumple en Rj tal que &micro;® Rj no esta F + , 

y 

&micro;Cb=/E ; 

resultado:=(resultado - Rj) E( Rj -b)E(&micro;,b) ; 
end; 

else listo:=verdadero; 

Hemos visto que si nos dan un conjunto de dependencias funcionales y multivaluadas, resulta provechoso 
encontrar un diseno de bases de datos que se ajuste a los tres criterios siguientes: 

* 4NF 

* conservacion de las dependencias 

* Producto sin perdida. 

Si todo lo que tenemos son dependencias funcionales, el primer criterio es justo el de BCNF. 

Es posible que no se logran los tres criterios antes mencionados, y es aun donde se abandona 4NF, y 
aceptamos BCNF o incluso 3NF, si es necesario para asegurar la conservacion de las dependencias 


4.3 FORMA NORMAL PROYECTO -PRODUCTO. 


La forma normal de proyecto - producto se define de manera similar a BCNF y4NF, excepto que se usan dependences de 
intersection. Un esquema de relaciones R esta en forma normal de proyecto- producto (PJNF) con respecto aun conjunto D de 

dependences funcionales multivaluadas y de intersection si para todas las dependences en D + de la forma* *(R 1 , R 2 ...R n ) 
donde cada Rj I R y R] E R 2 |=...E R n &acute; se cumple por to menos una de las siguientes condictones: 

*(R^ , R 2 ...R n ) es una dependence de producto trivial. 

Cada Rj es una superclave de R. 

Un diseno de base de datos esta en PJNF si cada miembro del conjunto de esquema de relaciones que comprende el diseno 
esta en PJNF. PJNF se llama quinta forma normal (5NF). 

4.4 FORMA NORMAL DE DOMINIO-CLAVE 

La forma norma de dominio- clave esta basada en tres nociones: 

DECLARACION DE DOMINIO. Sea A un atributo. sea down un conjunto de valores. La declaration de dominio A l down 
requiere que el valor de A de todas las tuplas sean valores en down. DECLARACION DE CLAVE. Sea Run 
esquema de relaciones en que K l R. La declaration de clave key (K) sea una superclave del esquema R es decir K 
® R. Observese que todas las declaraciones funcionales pero no todas las dependencias funcionales son 
declaraciones de clave. 

RESTRICCION GENERAL. Una restriction general es un predicado en el conjunto de todas las relaciones de un esquema 
dado. 


Ejercicios : 

Disene los modelos que considere mas eficientes para cada uno de los siguientes casos: 

a) una empresa desea automatizar su proceso de facturacion las facturas contienen un numero de folio, la fecha, 
los datos del cliente (RFC, nombre, direction) y de los productos que la factura ampara (clave, description, 
cantidad costo unitario e importe.) 



* Se repetirian nombre, RFC, dom. 

* En una misma factura se repetirian (fecha, numero de factura). 

* No hace falta guardar el importe. 

Version 2 


PROBLEMAS 

* Repetir datos del cliente por cada factura 

* Repite campo RFC y NUMFOL 


* No es necesario guardar el importe 



* Se repiten datos innecesariamente para cada articulo FECHA y RFC. 



* Se graba importe que es innecesario 

* Se repetirfan para cada factura. 



* Se repite fecha y RFC 



* No se sabria en que factura va la venta. 


Version 7 


PROBLEMAS 

* Se repiten CLAVE, DESCRIP y PUNIT para cada venta de ese articulo. 


MODELO OPTIMO. 
Version 8 



X® Y (Y depende de X) 

b)Dado una relacion R, el atributo Yde R es funcionalmente dependiente del atributo X de R si y solo siempre 
que dos tuplas de R coincidan en sus valores de X tambien coincidan en sus valores de Y. 

Ejemplo: 



1. - Determinar si una relacion es legal bajo un conjunto dado de dependences funcionales. Si una relacion R es legal bajo un 
conjunto F de dependences funcionales, se dice que R satis face a F. 

R- Equipos 

¥ i= {l, 2, 5} R no satisface aFj 
F 2 ={2,4} R si satisface a F 2 

2. - Especificar las limitaciones del conjunto de relaciones legales; de esta manera, se manejaran solamente las relaciones que 
satis fagan a un conjunto de dependences funcionales. 

3 Generacion de descomposiciones sin perdida mediante la aplicacion de diversos postulados preestablecidos para este fin. 
Ejemplo: 

X® (Y,Z) Descomposicion 
X ® Ysin perdida con perdida 
X® Z (XYZ) (XYZ) 
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(XY) (XZ) (XY) (YZ) 

Se dice que una dependencia funcional es trivial cuando todas las relaciones la satisfacen. En general, una 
dependencia funcional de la forma X® Y es trivial si X es un subconjunto impropio de Y (X y Yse forman de los 
mismos atributos) 

Ejemplo: de dependencias funcionales triviales. 

NC® NC 

(NC,NOM) ® (NC,NOM) 

Una dependencia funcional de la forma X® Yes completa si Y depende funcionalmente de X y no depende 
funcionalmente de ningun subconjunto propio de X. 

(X,Y)® Y 
X® Z 
X® Y 
Ejemplo: 

(NC,NOM) ® CARR ES INCOMPLETA 
NC® CARR 

NC® NOM ES COMPLETA 

(NC,CLAVEMATERIA,PERIODO) ® CAL ES COMPLETA 

TEORIA DE DEPENDENCIAS FUNCIONALES 

Si se tiene un conjunto de dependencias funcionales, estas pueden implicar que existan otras que tambien se 
cumplan. 

Sea F un conjunto de dependencias funcionales F + es el conjunto cerrado de F que contiene a todas las 
dependencias funcionales que F implica logicamente. Dado F podemos obtener F + ; el grado de complejidad 

para obtener F + varia en funcion del tamano de F. 

Ejemplo: 

F={ NC® NOM, NC® CARR, CARR® ESP,...} 

F + { NC® ESP,...} 

TECNICAS PARA DEDUCIR DEPENDENCIAS FUNCIONALES 
AXIOMAS DE ARMSTRONG 

1. - REGLA DE REFLEXIBIDAD. si X es un conjunto de atributos y Yes un subconjunto impropio de X (Yl X), 
entonces se cumple que X® Y. 

2. - REGLA DE AMPLIFICACION.- si se cumple que X® y entonces debe cumplirse que WX® WYsi W es un 
conjunto de atributos valido en la relacion. 

3. - REGLA DE TRANSITIVIDAD. si se cumple que X® Yy Y® Z, entonces se cumple que X® Z. 

Se dice que estas reglas son validas porque no se generan dependencias funcionales incorrectas. Las reglas 

son completas porque no dado un conjunto F de dependencias funcionales permiten obtener la totalidad de F + . 

Ocasionalmente su aplicacion puede darse en forma directa para calculas F + ; en estos casos se ocurre al uso 
de las siguientes reglas: 

1. -REGLA DE UNION, si se cumple X® YyX® Z, entonces se cumple que X® YZ. 

2. - REGLA DE DESCOMPOSICION. si se cumple que X® YZ, entonces se cumple que X® YyX® Z. 

3. - REGLA DE PSEUDOTRANSITIVIDAD. si se cumple X® Yy WY® Z, entonces se cumple WX® Z. 

FORMAS NORM ALES 

La razon de ser de las formas normales consiste en la estandarizacion de los conceptos relacionados al 
diseno eficiente de las estructuras y esquemas de una base de datos. 

Durante mucho tiempo se ha dependido en extremo de la experiencia y capacidad de los analistas y 
disenadores de bases de datos. Como es obvio, existiran discrepancias entre los metodos que estos aplican 
para obtener un modelo eficiente. Las formas normales permitiran la aplicacion de un estandar de eficiencia en 
niveles ascendentes mediante la aplicacion de las mencionadas formas normales. 

Se dice que una relacion (tabla) esta en una forma normal determinada si satisface cierto conjunto especifico de 
restricciones. 

UNIVERSO DE RELACIONES. 


Para avanzar de una forma normal a otra deben verificarse las restricciones de la actual y la nueva forma 
normal. Una de las herramientas mas utilizadas para alcanzar una nueva forma normal es la 
DESCOMPOSICION esta debe presentar las siguientes caracteristicas: 

* Debe realizarse sin perdida 

* Deben mantenerse las dependencias funcionales 

* Se debe evitar o reducir hasta donde sea posible la redundancia. 

CASO PRACTICO PARA NORMALIZAR. 

Un conjunto de proveedores distribuyen artfculos en ciudades especificas. Las ciudades se encuentran 
agrupadas por regiones, pero un proveedor solo puede cubrir una ciudad. Cada proveedor es capaz de 
distribuir artfculos que estan numerados consecutivamente. 

La siguiente tabla muestra la distribution de los artfculos que son distribuidos por cada proveedor y las 
existencias actuates de estos. 



Una relation esta en primera forma normal si y solo si los dominios de sus atributos solo contienen valores atomicos (no vas 
dejar ningun casillero do). 



SEGUNDA FORMA NORMAL 

Una relation esta en segunda forma normal si y solo si esta en primera forma normal y cada atributo no primo* 
es completamente dependiente de la Have primaria. 

*ATRIBUTO PRIMO: es aquel que forma parte de la Have primaria. 



TERCERA FORMA NORMAL 

Una relation esta en tercera forma normal si y solo si esta en segunda forma normal y todo atributo no primo es dependiente 
no transitivamente de la Have primaria. 

No se cumple la tercera forma normal porque hay transitividad de un proveedor a regioa 


Iiave (PROV, ART) 


Llave(PROV) 



Se considera que un esquema que alcanza tercera forma normal es eficiente. No obstante, se ha propuesto 
una mejora que permitira obtener un modelo mas eficiente con la ventaja de que no depende de formas 
normales anteriores (aunque se recomienda ampliamente alcanzar tercera forma normal antes de su aplicacion). 


BOYCE- CODD (FNBC) 

Una relacion esta en FNBC si y solo si todas las dependencias funcionales son completas y todos los 
atributos determinates son Haves candidatos. 

Ejemplo: 

Se desea el registro de alumnos; materias y profesores que la imparte. supongase que un profesor imparte 
solamente una materia. 



NOTAS: 

* Una relacion que esta en FNBC estara siempre en 3FN; esta relacion no es reciproca. 

* La forma normal BOYCE-CODD (FNBC) optimiza casos en los que existen varias Haves 
candidato traslapadas. (son aquellas que comparten atributos.). 

* Teoricamente, es mas simple puesto que no requiere de formas normales previas. 

OBJETIVOS DEL DISENO 

Se pueden plantear basicamente tres metas al realizar el diseno de un esquema de base de datos; 

a) FNBC 

b) DESCOMPOSICION DE PRODUCTO SIN PERDIDA 

c) CONSERVACION DE LAS DEPENDENCES FUNCIONALES. 

NOTA: 

CASOS ESPECIALES 

Puede ocurrir que en algunas situaciones se pierda n dependencias funcionales al alcanzar FNBC; esto trae 
como consecuencia una reduction en el rendimiento del esquema y pone en riesgo incluso la integridad de la 
base de datos. En estos casos sera preferible conservar el diseno alcanzado hasta 3FN. 

DEPENDENCIAS DE VALORES MULTIPLES 

Existen casos de relaciones en los que un atributo puede determinar a otro restringiendo su rango de valores 
validos. A este tipo de dependencias se les conoce como dependencias multivaluadas (DMV). 

FORMATO: 

Xee Y 

"X multidetermina a Y' 


MATERIA ee PROFESOR 


Las formas normales de nivel mas alto (4fn y 5fn) son aplicables para aquellos casos en los que existan 
dependencias multivaluadas y/o se presenta ciertas caracteristicas especiales de operation. 

CUARTA FORMA NORMAL 

Siempre que en una relacion R exista una dependencia multivaluada (DMV), la relacion esta en 4fn si todos 
los atributos de R son funcionalmente dependientes del multideterminador 
Si: 

R = {A,B>C,D} 

A B C D 


B ® ® D 
R estaen4FN Si 
B ® A 
B ® C 
NOTAS: 

* Si una relacion esta en 4FN, esta tambien en FNBC, la relacion no es reciproca 

* Cualquier relacion puede descomponerse sin perdida en un conjunto de relaciones en 4FN. 

QUINTA FORMA NORMAL 

Una relacion esta en 5FN si y solo si toda *dependencia de reunion en R esta implicando por las Haves 
candidatos de R. 

Si en: 

R = {A,B,C,D,E} 

* Son Haves candidate A y B 
*Son dependencias de reunion 
{A,B,C} 

{A,C,D} 

{B,E} 

R esta en 5FN 

NOTA: 

* La quinta forma norma es aplicable comunmente a aquellos casos en los que realizan 
descomposiciones hacia 3 o mas nuevas tablas. 

Unidad V: 

Modelo de Datos de Red 

• 5.1 Conceptos Basicos. 

• 5.2 Diagrama de Estructura de Datos. 

• 5.3 Modulo de Grupo de trabajo de Bases de DatosfOBGD CODASYL. 

5.1 CONCEPTOS BASICOS 

Una base de datos de red se compone por una coleccion de registras que se conectan entre si por medio de ligas. 

Un registro equivale a una entidad y un campo a un atributo del modelo entidad relacion. Los campos contienen exdusivamente 
valores atomicos. Una liga es una relacion que se establece solamente entre dos registros; es decir; debe utilizarse una liga para 


cada relacion entre una pareja de registros. 
Ejemplo: 

CLIENTES CUENTAS 



5.2 DIAGRAMAS DE ESTRUCTURAS DE DATOS 

Permiten mostrar graficamente el esquema de una base de datos en el modelo de red. Sus componentes 
principales son : 


- Cajas o cuadros: representan registros. 

- Lineas: representan ligas. 



El caso anterior muestra la conversion del modelo entidad relacion al modelo de red para una relacion simple 
donde no existen atributos descriptivos en la relacion. 


CASOS ESPECIALES 

a) LA RELACION TIENE ATRIBUTOS DESCRIPTIVOS 
E-R 


D. E. D. RED 


b) La relacion conecta a mas de dos conjuntos de entidades. 
Ejemplo: 


5.3 MODELO CODASYL DBTG 


Este modelo es ya una implementaron de las reglas generates de operacion del modelo de res. Toma de este 
los aspectos generates operativos, pero introduce las siguientes caracterfsticas particulares: 

Solo pueden utilizarse ligas muchos a uno. Se prohiben las ligas muchos a muchos para simplificar la 
implementaron. Las ligas uno a uno se representan utilizando ligas muchos a uno. 

Casos: 




CON JUNTOS DBTG 


Son representaciones mas concisas del modelo de red; representan genericamente entre registros. 



Una de las aplicaciones mas extendidas de los conjuntos DBTG es la de los grupos repetidos. Estos permiten 
simplificar la representation de atributos que pueden presentar valores multiples en una instancia determinada. 

Ejemplo: 

Suponga que un cuenta habiente tiene mas de un domicilio para el envfo de sus estados de cuenta y otras 
notificaciones. 


Unidad VI: 

Modelo de Datos Jerarquico 


• 6.1 Conceptos Basicos. 

• 6.2 Diagrama de Estructura de ArboL 

• 6.3 Registros Virtuales. 

6.1 CONCEPTOS BASICOS 


Una base de datos jerarquica consiste en una coleccion de registros que se conectan entre si por medio de ligas. Los 
registros y las ligas son similares a los del modelo de red, pero en el modelo jerarquico se organiza en forma de arbol con raiz 
(donde la raiz es nodo ficticio); de tal manera que una base de datos jerarquica es una coleccion de arboles de este tipo, 
formando un bosque. 

A cada arbol con raiz con raiz se le denomina arbol de base de datos. 

En este modelo un registro puede tener que repetirse en varios sitios que puede ocasionar los siguientes problemas: 

* Riesgos de la inconsistency al Ilevar a cabo actualizaciones. 

* Inevitable desperdicio de espacio en el medio de almacenamiento secundario. 

6.2 DIAGRAMAS DE ESTRUCTURAS DE ARBOL 

Un diagrama de estructura de arbol es el esquema de una base de datos jerarquica. Tiene dos componentes basicos: 
REGISTROS y LIGAS 

Estos diagramas son similares a los de estructura de datos en el modelo de red. La diferencia radica en que en el modelo de 
red los registros se organizan en forma de un grafo arbitrario mientras que en el modelo jerarquico se organiza en forma de un 
arbol con raiz. 

Las reglas para la formacion del arbol son: 

1. -No hay ciclos 

2. -De padre a hijos sonvalidas las relaciones de uno a uno a uno a muchos. 

El esquema de una base de datos jerarquica se representa como una coleccion de diagramas de estructuras de arbol. Para 


cada diagrama existe una unica instancia del arbol de base de datos. La raiz de este arbol es un nodo ficticio. Los hijos de ese 
nodo son instandas del tipo de registros adecuado. 

Ejemplo: 



CASOS PARTICULARES 



6.3 REGISTROS VIRTUALES. 


Dado que en las relaciones machos a muchos existe demasiada repetition de datos, se maneja el concepto de registro virtual. 
Un registro virtual es aquel que no se escribe fisicamente en el medio, sino que es una referencia (liga) a un registro existente en 
forma previa su representation es : 


La razon de utilizar registros virtuales es evitar la repetition de los datos, lo cual traeria consigo los siguientes inconvenientes: 


-Redundancia, en consecuencia desperdicio de espacio de almacenamiento. 
-Alto riesgo de inconsistencia durante las actualizaciones 


